R Installation locale

Nous allons localement installer R et l’éditeur Rstudio, afin de poursuivre le cours FIN 403 depuis chez vous.

Installation de votre environement de travail

  1. naviguer sur le slide du premier cours vous trouverez un tuto
  2. Installer R grâce au site suivant https://cloud.r-project.org/
  3. Puis, Installer Rstudio l’éditeur de R grâce au site suivant https://rstudio.com/products/rstudio/download/#download
  4. Tester votre installation en allant dans la console de RStudio pour rappel le slide présentant les différentes fenêtres de Rstudio
  5. Puis, Installer la package ggplot2.

Premiers graphique

  1. Charger la library ggplot2 et créer une data frame df avec comme nom de colonne a et b pour rappel afin de de réaliser les graphes ci-dessous, à l’aide des fonctions suivantes data.frame() ,seq() et sin(). Utilisez cette commande ?sin() et ?seq afin d’obtenir de l’aide dans la fenêtre en bas à droite de Rstudio.
  2. Utiliser la fonction geom_point(aes(x=,y=)) à l’aide du package ggplot2, ou de la fonction de base afin de retrouver les graphes suivants.

Column

TD installation de l’environement R function qplot

Column

TD installation de R function plot

R Markdown Introduction

Table

summary(cars)
     speed           dist       
 Min.   : 4.0   Min.   :  2.00  
 1st Qu.:12.0   1st Qu.: 26.00  
 Median :15.0   Median : 36.00  
 Mean   :15.4   Mean   : 42.98  
 3rd Qu.:19.0   3rd Qu.: 56.00  
 Max.   :25.0   Max.   :120.00  

Cette page est un document “R Markdown”. Markdown est un simple langage de syntaxe qui permet la génération de code sous format HTML, PDF, et MS Word documents.

Ce n’est pas un outil d’édition comme word «What you see is what you get» WYSIWYG via une interface graphique. A l’opposé Markdown est un code qui peut être catégorisé comme un outil WYSIWYM «What you see is what you mean».

Il faut en quelque sorte le compiler afin de voir le résultats de votre création à l’instar de Word Microsoft. L’avantage de R markdown réside dans la possibilité d’ajouter facilement du code R à l’intérieur de votre document et l’automatisation de rapport grâce au notion de fonction et d boucel que nous avons a vu à la fin du cours dernier.

Pour plus de détail, n’hésitez pas à visiter le site suivant afin de découvrir ce package R http://rmarkdown.rstudio.com.

Quand vous cliquez sur le bouton Knit bouton un document va être créé et vous pouvez facilement ajouté du code R dedans comme ci-dessous à l’aide du boutton Insert :

Plot

plot(cars)


Vous pouvez faire la même chose avec un graphe

html widget

DT::datatable(cars)

Vous pouvez faire la même chose avec un graphe interactif grâce au package DT pour plus d’information https://rstudio.github.io/DT/

Des images

![impressionant](https://media.giphy.com/media/w9xG5hsxZlqtevPlJQ/giphy.gif)

impressionant

Des listes

Nous allons parler durant ce cours de :

* Installation de R 
* Rmarkdown 
* data mining de données de pollution 

Nous allons parler durant ce cours de :

  • l’installation de R et Rstudio
  • Rmarkdown
  • data mining de données de pollution
  • et un peu de data visualisation

Des Videos

<iframe width="560" height="315" src="https://www.youtube.com/embed/rlR4PJn8b8I" frameborder="0" allowfullscreen></iframe>


Data Mining & Visualisation

Fin du dernier cours

  1. Coder une fonction factorielle grâce à une boucle for.
  2. Utiliser votre fonction pour calculer les factorielles entre \(x \, \epsilon \, [0,30]\)
  3. Vérifier le résultat de votre fonction à l’aide d’un graphe \(x \, \epsilon \, [0,30]\) et \(y = x!\). Pour ce faire, utiliser deux vecteurs x et y, ainsi que votre fonction.
  4. Importer les données de la ville d’angers
  5. Tracer cette série temporelle en fonction des dates.

TD Pollution

On va découvrir comment traiter des données de séries temporelles de pollution et de météo à Shanghai. Pour ce faire, nous allons explorer le fichier csv pollution_shanghai.csv.

Etape de Data Mining

  1. Créer un document Rmarkdown avec votre nom et prénom. Ajouter les lignes de commandes que vous allez lancer dans ce TD.
  2. Importer les données. Pour cela, vous pouvez utiliser les fonctions read.table(), read.csv() et readr::read_csv() ou l’interface graphique pour rappel.
  3. Quel est le type/class de l’objet que vous avez téléchargé et importé ?
  4. Même chose pour les éléments colonnes de cet objet ? Pensez à utiliser une boucle for.
  5. Explorer vos données à l’aide des fonctions head, tail,View et Summary ?
  6. Tracer des graphes de ces séries temporelles à l’aide de ggplot2. Pour faire cela nous allons apprendre les bases de ggplot

Column

Angers

Column

TD Pollution